智谱发布GLM-4.6模型,采用寒武纪国产芯片,首次实现FP8+Int4混合量化部署。该技术突破在保持模型精度的同时显著降低推理成本,为国产芯片支持大模型本地化运行开辟新路径。
智谱AI发布并开源新一代模型GLM-4.6,在Agentic Coding等关键能力上实现大幅提升。其编程能力已对齐国际顶尖模型Claude Sonnet4,并超越DeepSeek-V3.2-Exp,成为当前国内最强代码生成模型。该模型在国产化适配方面取得里程碑进展,已成功部署于寒武纪国产芯片平台。
智谱BigModel与彩智科技联合推出DeepKnown可信知识服务工具,帮助开发者构建准确可信的AI应用。该工具针对行业标准、法规政策等高精度知识需求,解决传统搜索API返回非权威信息的问题,提升智能体搜索的可靠性和准确性。
《AI日报》栏目每日提供AI领域热点内容,聚焦开发者,帮助了解技术趋势和创新产品。今日重点介绍智谱AI发布的革命性产品AutoGLM 2.0,该产品通过自然语言理解和多平台操作功能,实现语音操控,替代手动操作,具有划时代意义。
提升网络浏览体验的AI助手
几行代码接入大模型
chatglm
$0.43
Input tokens/M
$1.01
Output tokens/M
131.1k
Context Length
智谱ai
$4.5
$22.5
128k
$0.5
-
bullpoint
GLM-4.6-AWQ是对智谱AI的GLM-4.6(357B MoE)进行高性能AWQ量化的模型,专为vLLM推理进行了优化,能有效提升生产部署的吞吐量。该模型采用4位量化技术,在保持高精度的同时显著减少显存占用。
unsloth
GLM-4.6是智谱AI推出的新一代文本生成模型,相比GLM-4.5在多个方面有显著改进,包括更长的上下文窗口、更优的编码性能和更强的推理能力。该模型在多个公开基准测试中表现出色,与国内外领先模型相比具有竞争优势。
GLM-4.6是智谱AI开发的新一代大语言模型,相比GLM-4.5在上下文处理、编码能力和推理性能方面有显著提升。该模型支持200K上下文长度,在多个公开基准测试中表现出色,特别在代码生成、推理和代理任务方面具有竞争优势。
zai-org
GLM-4.6是智谱AI推出的新一代文本生成模型,相比GLM-4.5在上下文处理、编码性能、推理能力等方面实现显著提升,支持200K上下文长度,具备更强的智能体能力和精致的写作能力。
GLM-4.6-FP8是智谱AI推出的新一代文本生成模型,相比GLM-4.5在多个关键方面有显著改进。该模型具有更长的上下文窗口、卓越的编码性能、高级推理能力和更强大的智能体功能,能够处理更复杂的任务。
Jackmin108
GLM-4.5-Air是智谱AI推出的适用于智能体的基础模型,采用紧凑设计,统一了推理、编码和智能体能力,能满足智能体应用的复杂需求。该模型参数量适中且效率优越,已开源多种版本,可用于商业和二次开发。
mlx-community
基于智谱AI GLM-4.5-Air模型转换的3位深度量化权重(Deep Weight Quantization)版本,专为MLX框架优化,在保持较高性能的同时显著减少模型大小和推理资源需求
cpatonn
GLM-4.5V-AWQ-4bit是基于智谱AI下一代旗舰文本基础模型构建的量化版本多模态模型,通过AWQ-4bit量化技术优化,在保持优异性能的同时显著降低计算资源需求。该模型在42个公开视觉语言基准测试中达到同规模模型的SOTA性能,具备强大的视觉推理能力。
GLM-4.5-Air-2bit是基于智谱AI的GLM-4.5-Air模型转换而来的2位量化版本,采用MLX格式优化,可在Apple芯片设备上高效运行。该模型支持文本生成任务,具有轻量级和高效率的特点。
GLM-4.5-Air-6bit是基于智谱AI的GLM-4.5-Air模型转换而来的6位量化版本,专为MLX框架优化,提供高效的大语言模型推理能力。
GLM-4.5-Air-8bit是基于智谱AI的GLM-4.5-Air模型转换而来的8位量化版本,专门为MLX框架优化。该模型保持了原版强大的自然语言处理能力,同时通过量化技术减少了内存占用和计算需求,适合在Apple Silicon设备上高效运行。
GLM-4.1V-9B-Base是智谱AI开发的开源视觉语言基础模型,拥有90亿参数,专注于多模态推理能力,支持中英双语,处理高达4K分辨率的图像和64K上下文长度。
GLM-4-Z1-9B-0414是智谱AI推出的新一代90亿参数开源大语言模型,具有强大的文本生成和推理能力。该模型在数学推理和通用任务方面表现出色,在资源受限场景下实现了效率与效果的出色平衡,支持友好的本地部署。
GLM-4-9B-0414是智谱AI推出的90亿参数大语言模型,在文本生成领域表现优异。该模型在15T高质量数据上进行预训练,具备强大的文本生成能力,可应用于代码编写、故事创作、报告生成等多种场景,在效率和效果之间取得了出色平衡。
GLM-4-9B是智谱AI推出的GLM-4系列最新一代预训练模型的开源版本,在语义、数学、推理、代码和知识等数据集评估中表现出色,支持多语言和多种高级特性,包括网页浏览、代码执行、自定义工具调用和长文本推理等功能。
THUDM
GLM-4-9B是智谱AI推出的GLM-4系列最新一代预训练模型的开源版本,在语义、数学、推理、代码和知识等数据集评估中表现出色,具备多语言支持等先进特性。
GLM-Edge-4B-Chat是智谱AI开发的一个40亿参数的中英双语对话模型,专门针对边缘设备优化,支持高效的文本生成任务。该模型基于Transformer架构,具有轻量化、高效率的特点,适合在资源受限的环境中部署。
CogVideoX1.5-5B 是智谱AI开源的文本到视频生成模型,能够根据英文文本描述生成高质量视频。该模型支持生成1360×768分辨率、最高81帧(5秒)的视频,在视频创作领域具有广泛应用价值。
GLM-4-9B-Chat是智谱AI推出的GLM-4系列最新一代预训练模型的开源版本,在语义、数学、推理、代码和知识等数据集评估中表现出色,支持多轮对话、网页浏览、代码执行等先进特性,还支持多语言及长上下文推理。
GLM-4-9B是智谱AI推出的GLM-4系列最新一代预训练模型的开源版本,具备卓越的语义、数学、推理、代码和知识能力。
一个基于智谱API的MCP服务演示项目,展示了如何使用Model Context Protocol快速开发AI应用服务。
这是一个基于MCP协议的项目,集成了智谱AI和腾讯地图API,提供天气查询、地理编码和网络搜索等功能,支持命令行和Web界面两种交互方式。